1. 获取所需数据

所有一审案件及其前200个活跃原告

活跃原告性别及年龄统计

2. 针对前两百活跃原告的统计信息

2.1 活跃原告案件数量,胜诉案,赢率, 惩罚金,标的,案由在时间地区的分布,法院法官频率,以及诉讼费的比例

案件数量,胜诉案数量-时间 画图

案件数量,胜诉案数量-省份 画图

胜率和时间省份的图

案件数量, 胜诉案,胜率-时间和省份 画图

案件数量-地理信息 画图

惩罚金-时间地区

标的-时间地区

诉讼费比例

案由-时间地区

法院-所有案件和胜诉案件的频率

法官-所有案件和胜诉案件的频率

2.2 活跃原告在地区上的数量分布(包含整体,年份变化,以及其地区垄断的分析)

活跃原告数量-时间省份 地区信息图

垄断率超过50%的就可以认定该地区的活跃原告存在垄断现象,画图展示一下

2.3 活跃原告的活跃年份统计

2.4 活跃原告退出的原因分析(胜率,金额等等)

看活跃年份与赢率和金额的关系

2.6 经常被活跃原告告的被告有哪些,次数是多少,按照时间地区划分

2.7 是否存在某些活跃原告一直在起诉同一被告(看下前200个原告-被告的pair)

2.8 活跃原告是否倾向于在自己赢过的法院发起诉讼

(数据中的赢率信息存在不准确的问题,人工修正仍在进行中)

(赢率已修改完成)

2.9 如果在某一法院赢率很低,是否案件数量也不多